Комп`ютерна лінгвістика як прикладна лінгвістична дисципліна

Тема роботи: Комп'ютерна лінгвістика як прикладна лінгвістична дисципліна

Зміст

1. Комп'ютерна лінгвістика як прикладна лінгвістична дисципліна

2. Когнітивний інструментарій комп'ютерної лінгвістики

3. Деякі напрямки комп'ютерної лінгвістики

4. Гіпертекстові технології подання тексту

Література

1. Комп'ютерна лінгвістика як прикладна лінгвістична дисципліна

Під терміном "комп'ютерна лінгвістика" (computational linguistics) зазвичай розуміється широка область використання комп'ютерних інструментів - програм, комп'ютерних технологій організації та обробки даних - для моделювання функціонування мови в тих чи інших умовах, ситуаціях, проблемних областях, а також сфера застосування комп'ютерних моделей мови не тільки в лінгвістиці, а й у суміжних з нею дисциплінах. Власне, тільки в останньому випадку мова йде про прикладної лінгвістики в строгому сенсі, оскільки комп'ютерне моделювання мови може розглядатися і як сфера застосування теорії програмування (computer science) в галузі лінгвістики. Проте загальна практика така, що сфера комп'ютерної лінгвістики охоплює практично все, що пов'язано з використанням комп'ютерів у мовознавстві: "Термін" комп'ютерна лінгвістика "задає загальну орієнтацію на використання комп'ютерів для вирішення різноманітних наукових і практичних завдань, пов'язаних з мовою, ніяк не обмежуючи способи вирішення цих завдань ".

Інституційний аспект комп'ютерної лінгвістики. Як особливу науковий напрямок комп'ютерна лінгвістика оформилася в 60-і рр.. Потік публікацій в цій області дуже великий. Крім тематичних збірок, в США щоквартально виходить журнал "Комп'ютерна лінгвістика". Велику організаційну і наукову роботу проводить Асоціація з комп'ютерної лінгвістики, яка має регіональні структури по всьому світу (зокрема, європейське відділення). Кожні два роки проходять міжнародні конференції з комп'ютерної лінгвістики - КОЛІНГ. Відповідна проблематика широко представлена також на міжнародних конференціях з штучного інтелекту різних рівнів.

2. Когнітивний інструментарій комп'ютерної лінгвістики

Комп'ютерна лінгвістика як особлива прикладна дисципліна виділяється перш за все з інструменту - тобто з використання комп'ютерних засобів обробки мовних даних. Оскільки комп'ютерні програми, що моделюють ті чи інші аспекти функціонування мови, можуть використовувати різні засоби програмування, то про загальний метамови говорити начебто не доводиться. Однак це не так. Існують загальні принципи комп'ютерного моделювання мислення, які так чи інакше реалізуються в будь-якої комп'ютерної моделі. В основі цієї мови лежить теорія знань, розроблена в штучному інтелекті і утворює важливий розділ когнітивної науки.

Основна теза теорії знань свідчить, що мислення - це процес обробки й породження знань. "Знання" або "знання" вважається невизначуваним категорією. У якості "процесора", обробного знання, виступає когнітивна система людини. У епістемології та когнітивної науці розрізняють два основних види знань - декларативні ("знання що") і процедурні ("знання як" 2)). Декларативні знання представляються зазвичай у вигляді сукупності пропозицій, тверджень про що-небудь. Типовим прикладом декларативних знань можна вважати тлумачення слів в звичайних тлумачних словниках. Наприклад, чашка] - 'невеликий посуд для пиття округлої форми, зазвичай з ручкою, з порцеляни, фаянсу і т.п. '[MAC]. Декларативні знання піддаються процедурі верифікації в термінах "істина-неправда". Процедурні знання представляються як послідовність (список) операцій, дій, які слід виконати. Це деяка загальна інструкція про дії в деякій ситуації. Характерний приклад процедурних знань - інструкції по користуванню побутовими приладами.

На відміну від декларативних знань, процедурні знання неможливо верифікувати як істинні або хибні. Їх можна оцінювати тільки по успішності-неуспішності алгоритму.

Більшість понять когнітивного інструментарію комп'ютерної лінгвістики омонімічно: вони одночасно позначають деякі реальні сутності когнітивної системи людини і способи подання цих сутностей на деяких метамови. Іншими словами, елементи метамови мають онтологічний і інструментальний аспект. Онтологічно поділ декларативних і процедурних знань відповідає різним типам знань когнітивної системи людини. Так, знання про конкретні предмети, об'єктах дійсності переважно декларативні, а функціональні здібності людини до ходіння, бігу, водінню машини реалізуються в когнітивної системі як процедурні знання. Інструментально знання (як онтологічно процедурне, так і декларативне) можна представити як сукупність дескрипцій, описів і як алгоритм, інструкцію. Іншими словами, онтологічно декларативне знання про об'єкт дійсності "стіл" можна уявити процедурно як сукупність інструкцій, алгоритмів з його створення, складання (= креативний аспект процедурного знання) або як алгоритм його типового використання (= функціональний аспект процедурного знання). У першому випадку це може бути керівництво для початківця столяра, а в другому - опис можливостей офісного столу. Вірно і зворотне: онтологічно процедурне знання можна представити декларативно.

Потребує окремого обговорення, всяке чи онтологічно декларативне знання представимо як процедурне, а будь-яке онтологічно процедурне - як декларативне. Дослідники сходяться в тому, що всяке декларативне знання в принципі можна уявити процедурно, хоча це може виявитися для когнітивної системи дуже неекономним. Зворотне навряд чи справедливо. Справа в тому, що декларативне знання істотно більш експліцитно, воно легше усвідомлюється людиною, ніж процедурне. На противагу декларативним знання, процедурне знання переважно імпліцитно. Так, мовна здатність, будучи процедурних знанням, прихована від людини, не усвідомлюється ім. Спроба експлікувати механізми функціонування мови призводить до дисфункції. Фахівцям у галузі лексичної семантики відомо, наприклад, що тривала семантична інтроспекція, необхідна для вивчення плану змісту слова, призводить до того, що дослідник частково втрачає здатність до розрізнення правильних і неправильних вживань аналізованого слова. Можна навести й інші приклади. Відомо, що з точки зору механіки тіло людини є складною системою двох взаємодіючих маятників.

У теорії знань для вивчення і представлення знання використовуються різні структури знань - фрейми, сценарії, плани. Згідно з М. Мінському, "фрейм - це структура даних, призначена для представлення стереотипної ситуації" [Мінський 1978, с.254]. Більш розгорнуто можна сказати, що фрейм є концептуальною структурою для декларативного подання знань про типізованої тематично єдиної ситуації, що містить слоти, пов'язані між собою певними семантичними відносинами. З метою наочності фрейм часто представляють у вигляді таблиці, рядки якої утворюють слоти. Кожен слот має своє ім'я і зміст (див. табл.1).

Таблиця 1

Частковий фрейму "стіл" у табличному поданні

Ім'я слота	Зміст слота
кількість ніжок	чотири, щонайбільше, мінімум три
матеріал	дерево, пластмаса, скло
поверхню	прямокутник, овал, коло, квадрат
наявність тумб	факультативно
функції	обідній, журнальний, робітник і пр.
і т.д.

Залежно від конкретного завдання структуризація фрейму може бути істотно більш складною; фрейм може включати вкладені подфрейми і відсилання до інших фреймах.

Замість таблиці часто використовується предикатну форма подання. У цьому випадку фрейм має форму предиката або функції з аргументами. Існують і інші способи подання фрейму. Наприклад, він може представлятися у вигляді кортежу наступного виду: {(ім'я фрейма) (ім'я слота)) (значення слота ,),..., (ім'я слота _п) (значення слота _л)}.

Зазвичай такий вигляд мають фрейми в мовах уявленнях знань.

Як і інші когнітивні категорії комп'ютерної лінгвістики, поняття фрейму омонімічно. Онтологічно - це частина когнітивної системи людини, і в цьому сенсі фрейм можна зіставити з такими поняттями як гештальт, прототип, стереотип, схема. У когнітивної психології ці категорії розглядаються саме з онтологічної точки зору. Так, Д. Норман розрізняє два основних способи побутування і організації знань у когнітивній системі людини - семантичні мережі і схеми. "Схеми, - пише він, - представляють собою організовані пакети знання, зібрані для репрезентації окремих самостійних одиниць знання. Моя схема для Сема може містити інформацію, що описує його фізичні особливості, його активність та індивідуальні риси. Ця схема співвідноситься з іншими схемами, які описують інші його боку "[Норман 1998, с.359]. Якщо ж брати інструментальну сторону категорії фрейму, то це структура для декларативного подання знань. У наявних системах ШІ фрейми можуть утворювати складні структури знань; системи фреймів допускають ієрархію - один фрейм може бути частиною іншого фрейму.

За змістом поняття фрейму дуже близько категорії тлумачення. Дійсно, слот - аналог валентності, заповнення слота - аналог актанта. Основна відмінність між ними полягає в тому, що тлумачення містить тільки лінгвістично релевантну інформацію про план змісту слова, а фрейм, по-перше, не обов'язково прив'язаний до слова, і, по-друге, включає всю релевантну для даної проблемної ситуації інформацію, в тому числі і екстралінгвістичну (знання про світ) 3).

Сценарій представляє собою концептуальну структуру для процедурного представлення знань про стереотипної ситуації або стереотипному поведінці. Елементами сценарію є кроки алгоритму чи інструкції. Зазвичай говорять про "сценарії відвідування ресторану", "сценарії покупки" і т.п.

Спочатку фрейм також використовувався для процедурного подання (пор. термін "процедурний кадр"), проте зараз в цьому сенсі частіше вживається термін "сценарій". Сценарій можна уявити не тільки у вигляді алгоритму, але і у вигляді мережі, вершин якої відповідають деякі ситуації, а дуг - зв'язки між ситуаціями. Поряд з поняттям сценарію, деякі дослідники залучають для комп'ютерного моделювання інтелекту категорію скрипта. За Р. Шенк, скрипт - це деяка загальноприйнята, загальновідома послідовність причинних зв'язків [Schank 1981]. Наприклад, розуміння діалогу

На вулиці ллє як з відра.

Все одно доводиться виходити у магазин: в будинку їсти нічого - вчора гості все підмели.

грунтується на неекспліцірованних семантичних зв'язках типу 'якщо йде дощ, на вулицю виходити небажано, оскільки можна захворіти'. Ці зв'язки формують скрипт, який і використовується носіями мови для розуміння мовного і немовного поведінки один одного.

У результаті застосування сценарію до конкретної проблемної ситуації формується план). План використовується для процедурного представлення знань про можливі дії, що ведуть до досягнення визначеної мети. План співвідносить мету з послідовністю дій.

У загальному випадку план включає послідовність процедур, які переводять початковий стан системи в кінцеве і ведуть до досягнення певної підцілі та цілі. У системах ШІ план виникає в результаті планування або плануючої діяльності відповідного модуля - модуля планування. В основі процесу планування може лежати адаптація даних одного або декількох сценаріїв, активізованих тестуючими процедурами, для вирішення проблемної ситуації. Виконання плану проводиться екзекутивність модулем, керуючим когнітивними процедурами та фізичними діями системи. У елементарному випадку план в інтелектуальній системі представляє собою просту послідовність операцій; в більш складних версіях план зв'язується з конкретним суб'єктом, його ресурсами, можливостями, цілями, з докладною інформацією про проблемну ситуацію і т.д. Виникнення плану відбувається в процесі комунікації між моделлю світу, частину якої утворюють сценарії, які планують модулем і екзекутивність модулем.

На відміну від сценарію, план пов'язані з конкретною ситуацією, конкретним виконавцем і переслідує досягнення певної мети. Вибір плану регулюється ресурсами виконавця. Здійснимість плану - обов'язкова умова його породження в когнітивної системі, а до сценарію характеристика здійсненності непріложіма.

Ще одне важливе поняття - модель світу. Під моделлю світу зазвичай розуміється сукупність певним чином організованих знань про світ, властивих когнітивної системи або її комп'ютерної моделі. У кілька більш загальному вигляді про моделі світу говорять як про частину когнітивної системи, що зберігає знання про устрій світу, його закономірності і пр. В іншому розумінні модель світу зв'язується з результатами розуміння тексту або - ширше - дискурсу. У процесі розуміння дискурсу будується його ментальна модель, яка є результатом взаємодії плану змісту тексту та знань про світ, властивих даному суб'єкту [Джонсон-Лерд 1988, с.237 і далі]. Перше і друге розуміння часто об'єднуються. Це типово для дослідників-лінгвістів, що працюють у рамках когнітивної лінгвістики та когнітивної науки.

Тісно пов'язане з категорією фрейму поняття сцени. Категорія сцени переважно використовується в літературі як позначення концептуальної структури для декларативного подання актуалізована в мовному акті і виділених мовними засобами (лексемами, синтаксичними конструкціями, граматичними категоріями і пр) ситуацій та їх частей5). Будучи пов'язана з мовними формами, сцена часто актуалізації певним словом або виразом. У граматиках сюжетів (див. нижче) сцена постає як частина епізоду або розповіді. Характерні приклади сцен - сукупність кубиків, з якими працює система ШІ, місце дії в оповіданні і учасники дії і т.д. У штучному інтелекті сцени використовуються в системах розпізнавання образів, а також у програмах, орієнтованих на дослідження (аналіз, опис) проблемних ситуацій. Поняття сцени отримало широке поширення в теоретичній лінгвістиці, а також логіці, зокрема у ситуаційній семантиці, в якій значення лексичної одиниці безпосередньо пов'язується зі сценою.

3. Деякі напрямки комп'ютерної лінгвістики

Звернімося до тих областях комп'ютерної лінгвістики, які безпосередньо пов'язані з оптимізацією когнітивної функції мови. Нижче як приклад розглядаються три сфери комп'ютерного моделювання, в яких використовуються знання про функціонування мовної системи: моделювання спілкування, моделювання структури сюжету і гіпертекстові технології представлення тексту.

Моделювання спілкування. У вузькому сенсі проблематика комп'ютерної лінгвістики часто пов'язується з моделюванням спілкування, зокрема, із забезпеченням спілкування людини з ЕОМ на природній або обмеженою природною мовою. Це відноситься до оптимізації мови як засобу спілкування. Втім, комп'ютерні моделі спілкування часто використовуються для вивчення самого процесу спілкування. Зупинимося докладніше на досвіді створення та використання саме таких моделей.

Вивчення вже нагромадилося досвіду експлуатації комп'ютерних систем, які вимагали забезпечення взаємодії з ЕОМ природною мовою, дозволило дослідникам по-новому поглянути на функції і структуру природної комунікації. У центр уваги потрапили питання, які раніше були на периферії теорії діалогу, дискурс-аналізу та теорії комунікації. Що забезпечує природність спілкування? Які умови зв'язності бесіди? Коли спілкування виявляється успішним? У яких випадках виникають комунікативні невдачі і чи можна їх уникнути? Які стратегії спілкування використовують учасники комунікативної взаємодії при досягненні своїх комунікативних цілей? Це далеко не вичерпний список теоретичних проблем, котрі виникли у зв'язку з функціонуванням комп'ютерних моделей спілкування.

Однією з найбільш цікавих комп'ютерних моделей діалогу, що викликала жваві теоретичні дискусії, була програма Джозефа Вейценбаум "Еліза", перший варіант якої з'явився в 1966 р. Спочатку "Еліза" створювалася як іграшка, як навчальний зразок програми-імітатора, метою якої є не моделювання мислення в точному сенсі, а моделювання мовної поведінки. Програма підтримувала розмову зі співрозмовником у реальному масштабі часу, однак при її розробці були використані обмежені програмістські ресурси, лінгвістичний аналіз і синтез також були зведені до мінімуму. Проте програма функціонувала настільки успішно, що фактично спростувала відомий тест Тьюринга на створення штучного інтелекту. Як відомо, Тьюринг замість софістіцірованного обговорення філософського питання про те, чи може машина мислити, запропонував ігрову завдання наступного типу. Нехай є три учасники: чоловік Л, жінка В і запитувач С. запитують не знає, хто чоловік, а хто - жінка. Ставлячи питання учасникам гри, С повинен спробувати визначити, хто є чоловіком, а хто - жінкою, при цьому учасник намагається містифікувати запитувача, видаючи йому не помилкову, але спотворену інформацію, а учасник В - навпаки, прагне допомогти С. Зрозуміло, що спілкування відбувається не безпосередньо, а через телетайп або за допомогою записок, віддрукованих на друкарській машинці. Що станеться, якщо в якості А виступатиме система ШІ? Чи буде запитувач помилятися так само часто? [Turing 1950, р.434]. Простіший варіант цього тесту зводиться до того, що кілька учасників розмовляють з деяким іншим учасником X. Проблема побудови штучного інтелекту вирішена, якщо більшість учасників не зможе встановити, з ким вони розмовляють - з людиною або машиною.

Програма "Еліза" була використана групою дослідників на чолі з М. Макгайром для вивчення структури діалогу та особливостей природномовної комунікації [McGuire 1971]. У проводився експерименті з "Елізою" розмовляли протягом години 24 випробовуваних. Спілкування відбувалося за допомогою телетайпу. За час бесіди кожен учасник ввів від 10 до 65 реплік і отримав на них відповіді. Після закінчення 15 учасників (62%) були впевнені, що їм відповів чоловік, 5 піддослідних (21%) виявили певні коливання і лише четверо учасників (17%) були абсолютно впевнені, що спілкувалися з ЕОМ. З лінгвістичної точки зору алгоритми програми "Еліза" включають мінімум лінгвістичної інформації. По-перше, це комплекс ключових слів, які актуалізації деякі стійкі комунікативні формули (шаблони), по-друге, здатність відносно нескладно трансформувати попереднє висловлювання.

Цікаво, що істотна тематична обмеженість комунікації і значна кількість помилок і неточностей у відповіді (близько 19% неточних або випадають з контексту реплік "Елізи" у згадуваному експерименті М. Макгайра), не завадили випробуваним визнати партнера по комунікації людиною. Справа тут зовсім не в патологічної дурості піддослідних. Це прояв найважливішою особливості комунікації на природній мові: природномовної дискурс дуже терпимо по відношенню до збоїв і помилок - він надмірний і помехоустойчів. Репліки "Елізи", випадали з нормального спілкування, випробовувані легко пояснювали звичайними збоями в розумінні своєї попередньої репліки, не цілком нормальними умовами спілкування, жартівливим настроєм партнера. Стійкість природного дискурсу пояснюється також здібностями людини до інтерпретації мовних дій: людина, що приймає роль учасника діалогу, веде себе відповідним чином. Маючи установку на спілкування, він повинен намагатися включити в комунікацію все те, що за формою нагадує мовленнєвий акт, репліку. Іншими словами, він схильний наділяти сенсом те, що часто сенсу не має. У цьому випадку випробовувані самі породжують сенс діалогу, самі забезпечують його зв'язність, самі приписують партнеру комунікативні інтенції.

Другий важливий висновок експерименту: випробувані досить швидко ухвалювали рішення про те, хто перед ними - комп'ютер або человек.22 учасника з 24 усвідомили для себе ситуацію не більше, ніж за п'ять обмінів репліками, і далі не змінювали свого рішення. Визначення ролей у комунікації відноситься до метарівні спілкування, оскільки це становить одну з передумов успішної комунікації, що оберігає спілкування від численних комунікативних невдач.

Зрозуміло, що визначення ролей учасників багато в чому визначає вибір стратегії комунікативної поведінки. Дійсно, краще відразу визначити, з ким ми розмовляємо по телефону - з давнім другом або чиновником податкової інспекції. З'ясування того, ким є співрозмовник - машиною або людиною, також відноситься до метарівні спілкування, і випробувані намагалися встановити рольові характеристики партнера як можна раніше.

Це властивість природномовної комунікації можна назвати принципом пріоритету метакоммунікатівних параметрів ситуації спілкування.

Третє важливе слідство з експерименту М. Макгайра пов'язано з існуванням різних типів комунікативної взаємодії між людьми. Успішне взаємодія між людиною і програмою типу "Еліза" можливо тільки в ситуації, коли відбувається так зване "асоціативне спілкування", при якому репліки діалогу пов'язані не стільки логічними відносинами типу "причина-наслідок", "посилка-висновок", а асоціаціями. Асоціативне спілкування не має конкретної спрямованості; саме підтримання розмови може служити її виправданням. Співрозмовники не переслідують мети вирішити якусь проблему або виробити єдину точку зору на якесь питання. У класифікації Р. Якобсона для комунікації такого типу запропонований термін "фатіческое спілкування" [Якобсон 1975]. Зауважимо, що бесіда лікаря-психіатра з пацієнтом по формі також має вигляд фатической спілкування, хоча і переслідує цілком певну мету збору даних про захворювання пацієнта і наступному вербальному і невербальному впливі на його психіку для досягнення лікувального ефекту. "Еліза" не змогла б успішно імітувати спілкування в комунікативній ситуації, названої М. Макгайром "рішення завдань", оскільки вона не здатна зрозуміти проблемну ситуацію, тобто побудувати модель світу дискурсу, визначити альтернативи виходу з проблеми, вибрати одну з альтернатив і т. д. Одна з типових стратегій "відходу від нерозуміння", реалізована в програмі "Еліза" - зміна теми бесіди. Очевидно, що така стратегія ведення бесіди навряд чи приведе до успіху при спільному пошуку вирішення проблеми.

Нарешті, четвертий висновок можна сформулювати як неуніверсальність правил комунікативної взаємодії. Він стосується самих закономірностей спілкування на природній мові. Кожен тип комунікації обслуговується своїм набором відносно простих правил, що забезпечують зв'язність дискурсу, його осмисленість для учасників. Типологія видів спілкування задається відповідними наборами правил. З експериментів М. Макгайра з програмою "Еліза" випливає, що крім асоціативного (= фатической) способу спілкування, виділяється ще "рішення задач", "задавання питань" і "уточнення розуміння". З лінгвістичної точки зору ці типи, швидше за все, неоднорідні, перетинаються і навіть знаходяться на різних рівнях дискурсу. Так, "уточнення розуміння" відноситься до метарівні комунікації, "задавання питань" може бути частиною стратегії "рішення задач" і "уточнення розуміння" і т.д. Істотно, що комп'ютерний експеримент з програмою, що моделює поведінку учасника комунікації, дозволяє експериментально підтвердити або спростувати багато положень теорії діалогу, розроблені як у лінгвістиці, так і в суміжних дисциплінах - в дискурс-аналізі, теорії комунікації, психології та соціології спілкування.

Моделювання структури сюжету. Вивчення структури сюжету відноситься до проблематики структурного літературознавства (у широкому сенсі), психології творчості та культурології. Наявні комп'ютерні програми моделювання сюжету грунтуються на трьох базових формалізму подання сюжету - морфологічному та синтаксичному напрямках подання сюжету, а також на когнітивному підході.

"Морфологія" сюжету. Ідеї про морфологічному пристрої структури сюжету сходять до відомих робіт В.Я. Проппа про російську чарівній казці [Пропп 1928; Пропп 1986]. Пропп зауважив, що при великій кількості персонажів і подій чарівної казки кількість функцій персонажів обмежено: "Постійними, стійкими елементами казки служать функції дійових осіб, незалежно від того, ким і як вони виконуються. Вони утворюють основні складові частини казки" [Пропп 1928, с. 31]. До числа базових відносяться, наприклад, такі функції:

відлучення персонажа казки з будинку;

заборона герою на дію;

порушення заборони;

отримання шкідником інформації про жертву;

обман жертви шкідником;

мимовільне пособництво жертви вредителю і т.д.

Ідеї Проппа лягли в основу комп'ютерної програми TALE, що моделює породження сюжету казки. В основу алгоритму програми TALE покладена послідовність функцій персонажів казки. Фактично функції Проппа задавали безліч типізованих ситуацій, впорядкованих на основі аналізу емпіричного матеріалу. Можливості зчеплення різних ситуацій в правилах породження визначалися типовою послідовністю функцій - у тому вигляді, в якому це вдається встановити з текстів казок. У програмі типові послідовності функцій описувалися як типові сценарії зустрічей персонажів.

Надалі система була ускладнена за рахунок введення моделі світу казки, географія якого складається із звичайного світу, проміжного (середнього) світу та іншого світу [Гаазе-Рапопорт, Поспєлов, Семенова 1984]. Кожен світ складається з локусів, пов'язаних між собою певними відносинами. Відносини пов'язують не тільки локуси всередині кожного світу, але і локуси різних світів. Звичайний світ складається з наступних локусів: місце проживання героя (локус 1), місце отримання завдання (локус Г), місце дарування чарівних предметів, що допомагають виконати завдання. Перший локус і локус штрих часто збігаються (пор. казки про падчерки і злий Мачусі). До звичайного світу відносяться також локуси 3 (їх може бути багато), в яких долаються перешкоди за допомогою чарівних предметів. Кількість перешкод, як правило, збігається з кількістю чарівних предметів. Після подолання перешкод герой опиняється в проміжному світі, вартовим якого є Баба-Яга. Середній світ відокремлює світ героїв від світу антигероїв. Функції Баби-Яги різняться - вона може виступати як дарувальниця інформації або чергового чарівного засобу, а може виступати на боці антигероїв (наприклад, при акценті на людожерської поведінці Баби-Яги). Інший світ включає місце проживання антигероя (локус 5), місце битви між героєм і антигероєм (локус 6) і, нарешті, локус 7 - місце нагороди чи мети, якої домагається герой. Локуси пов'язані відносинами переходу, які представляють можливі послідовності розгортання сюжету.

Модифікована версія програми TALE має наступну блок-схему [Гаазе-Рапопорт, Поспєлов, Семенова 1984, с.52]:

Блок-схема програми TALE

Робота програми починається з першого блоку, в якому вибирається тип сюжету казки та її персонажі. Тут же формується експозиція казки (setting). У другому блоці зберігаються описи, пов'язані з персонажами, а в четвертому - постійні характеристики персонажів. Описи даються під фреймоподобних структурах представлення знань. За допомогою другого і третього блоків формуються мотиви і вчинки персонажів. Третій блок задає послідовність руху персонажів по локусами. В останньому (шостому) блоці відбувається збірка породжених фрагментів казки.

Блок-схема модифікованого варіанту програми TALE показує, що чисто "морфологічного" підходу до структури сюжету казки явно недостатньо. "Морфеми" казкового сюжету повинні не тільки певним чином поєднуватися між собою, а й мати специфічні обмеження на сполучуваність. Фіксація одного типового порядку проходження функцій персонажів чарівної казки істотно обмежує наявні можливості сполучуваності. Більш адекватне вирішення цієї проблеми дає синтаксичний підхід до структури сюжету.

"Синтаксис" сюжету. Теоретичну основу синтаксичного підходу до сюжету тексту склали "сюжетні граматики" (story grammars). Сюжетні граматики з'явилися в середині 70-х рр.. в результаті переносу ідей генеративної граматики Н. Хомського на опис макроструктури тексту. Якщо найважливішими складовими синтаксичної структури в породжує граматиці були дієслівні та іменні групи, то в більшості сюжетних граматик в якості базових виділялися експозиція (setting), подія і епізод. У теорії сюжетних граматик широко обговорювалися умови мінімальності: обмеження, що визначали статус послідовності з елементів сюжету як нормальний сюжет. Виявилося, однак, що суто лінгвістичними методами це зробити неможливо. Багато обмеження носять соціокультурний характер. Сюжетні граматики, істотно розрізняючись набором категорій в дереві породження, допускали вельми обмежений набір правил модифікації наративної структури. У переважній більшості випадків ці правила запозичені з тієї ж граматики. Потенціал варіювання структури сюжету забезпечується в першу чергу трансформаціями пересування та опущення. Наприклад, текст зізнання злочинця, що фіксує реальну послідовність розгортання подій у злочині, можна за допомогою перестановок і опущень перетворити в детективний сюжет: {злочинець → задум → знаряддя вбивства → місце → вбивство → виявлення трупа → пошуки злочинця} → {виявлення трупа → виявлення знаряддя вбивства → пошуки злочинця}.

Використання сюжетних граматик в комп'ютерному моделюванні виявилося не зовсім вдалим. Синтактична компонент сюжету, описуваний граматиками, відображає чисто зовнішні особливості тексту. Не вдається виявити операціональні критерії виділення різних складових сюжету.

Основний висновок дискусії про недоліки сюжетних граматик звівся до необхідності опису сюжету в рамках структури доцільної діяльності, тобто із залученням категорій "мета", "проблема", "план" і т.д. Іншими словами, метамови, що враховує тільки зовнішні особливості сюжету, явно недостатньо. Необхідно звернення до когнітивних станів персонажів.

Когнітивний підхід до сюжету. На початку 80-х рр.. однієї з учениць Р. Шенка - В. Ленерт - у рамках робіт зі створення комп'ютерного генератора сюжетів був запропонований оригінальний формалізм афективних сюжетних одиниць (АСЕ - Affective Plot Units), що виявився потужним засобом представлення структури сюжету [Lehnert 1982]. При тому, що він був спочатку розроблений для системи ШІ, цей формалізм використовувався в чисто теоретичних дослідженнях. Сутність підходу Ленерт полягала в тому, що сюжет описувався як послідовна зміна когнітивно-емоційних (афективних) станів персонажів. Тим самим у центрі уваги формалізму Ленерт стоять не зовнішні компоненти сюжету - експозиція, подія, епізод, мораль - а його змістовні характеристики. У цьому відношенні формалізм Ленерт почасти виявляється поверненням до ідей Проппа.

Кожна афективна сюжетна одиниця являє собою бінарне відношення, що зв'язує деякі події, оцінювані персонажами позитивно (+) або негативно (-), і когнітивно-емоційні стани персонажів (у різних комбінаціях - подія & стан; подія & подія і т.д.). Бінарне відношення не є однорідним. Усього виділяється п'ять типів бінарних відносин, спеціфіціруемих в кожній афективної сюжетної одиниці. Бінарне відношення може бути мотивацією (позначення - т), актуалізацією (а), припиненням однієї дії іншим (t), еквівалентністю (е), а також афективної каузальною зв'язком між персонажами. Кожна афективна сюжетна одиниця отримує назву, наприклад, УСПІХ, НЕВДАЧА, завзятість, ПРОБЛЕМА і т.д.

4. Гіпертекстові технології подання тексту

Феномен гіпертексту можна обговорювати з кількох точок зору. З одного боку, це особливий спосіб представлення, організації тексту, з іншого - новий вид тексту, протиставлений за багатьма своїми властивостями звичайного тексту, сформованому в гутенберговской традиції друкарства. І, нарешті, це новий спосіб, інструмент та нова технологія розуміння тексту.

Теоретичні підстави гіпертексту. Багато дослідників розглядають створення гіпертексту як початок нової інформаційної епохи, протиставила ері друкарства. Лінійність листи, зовні відбиває лінійність мови, виявляється фундаментальною категорією, що обмежує мислення людини та розуміння тексту. Світ сенсу нелинеен, тому стиснення змістової інформації в лінійному мовному відрізку вимагає використання спеціальних "комунікативних упаковок" - членування на тему і рему, поділ плану змісту висловлювання на експліцитні (затвердження, пропозиція, фокус) та імпліцитні (пресупозиція, наслідок, імплікатура дискурсу) шари . Відмова від лінійності тексту і в процесі його уявлення читачеві (читання і розуміння), і в процесі синтезу, на думку теоретиків, сприяв би "звільнення" мислення і навіть виникнення його нових форм.

Прототиповий текст - це монолог. Тим часом багато лінгвістів (і серед них М. Бахтін і Л. Якубинский) вказували на вторинність монологу в порівнянні з діалогом. Гіпертекст з цієї точки зору дозволяє усунути штучну монологичность тексту.

Звичайний текст, як правило, має автора. Гіпертекст автора в традиційному розумінні не має - у нього безліч авторів, причому для постійно змінюється гіпертексту авторський колектив також постійно змінюється. Зміна статусу автора змінює і статус читача: в гіпертекстової системі розуміння часто супроводжується зміною компонентів гіпертексту або, як мінімум, вибором шляху перегляду, що знову-таки акт творчий, авторський.

Множинність авторства має і ще один наслідок: у гіпертексті представлено багато точок зору на проблему, а в звичайному тексті - тільки одна. Саме тому гіпертекст більш об'єктивний і більше толерантний до читача, ніж класичний текст.

Гіпертекстові технології дозволяють легко поєднувати різні види інформації - звичайний текст, малюнок, графік, таблицю, схему, звук і зображення, що рухається. Як традиційний текст, так і гіпертекст - феномени, породжені новими технологіями. У першому випадку технологія дозволила легко тиражувати і розповсюджувати знання самих різних типів, а в другому - комп'ютерні технології дали можливість змінити сам зовнішній вигляд тексту і його структуру. Різнорідність гіпертексту - це перше технологічне властивість гіпертексту, технологічне в тому сенсі, що воно безпосередньо випливає з використовуваної комп'ютерної технології. Друге технологічне властивість гіпертексту - його нелінійність. Гіпертекст не має стандартної, звичайної послідовності читання. Інші властивості гіпертексту в тій чи іншій мірі є наслідками з цих двох технологічних властивостей.

Підсумувати відмінності тексту і гіпертексту можна наступним чином:

кінцівку, закінченість традиційного тексту vs. нескінченність, незакінченість, відкритість гіпертексту;

лінійність тексту vs. нелінійність гіпертексту;

точне авторство тексту vs. відсутність авторства (у традиційному розумінні) у гіпертексту;

зняття протиставлення між автором і читачем;

суб'єктивність, однобічність звичайного тексту vs. об'єктивність, багатосторонність гіпертексту;

однорідність звичайного тексту vs. неоднорідність гіпертексту.

Компоненти гіпертексту. Структурно гіпертекст може бути представлений як граф, у вузлах якого знаходяться традиційні тексти або їх фрагменти, зображення, таблиці, відеоролики і т.д. Вузли пов'язані різноманітними відносинами, типи яких задаються розробниками програмного забезпечення гіпертексту або самим читачем. Відносини задають потенційні можливості пересування або навігації по гіпертексту. Стосунки можуть бути односпрямованим або двонаправленими. Відповідно, двонаправлені стрілки дозволяють рухатися користувачеві в обидві сторони, а односпрямовані - тільки в одну. Ланцюжок вузлів, через які проходить читач при перегляді компонентів тексту, утворює шлях або маршрут.

Елементи типології гіпертексту. Перше протиставлення належить до структури гіпертексту. Гіпертекст може бути ієрархічним або мережевим. Ієрархічне - деревоподібна - будова гіпертексту істотно обмежує можливості переходу між його компонентами. У такому гіпертексті відносини між компонентами нагадують структуру тезауруса, заснованого на родо-видових зв'язках. Ієрархічний гіпертекст не реалізує всіх можливостей технології гіпертексту. У середовищі розробників гіпертекстових систем він не користується популярністю (хоча і досить часто реалізується у працюючих системах).

Друге протиставлення характеризує не саму структуру гіпертексту, а можливості програмного забезпечення. Тут розрізняються прості і складні гіпертексти. Прикладом простого програмного забезпечення гіпертексту може служити електронне зміст документа, що дозволяє перейти до будь-якої частини змісту, минаючи етап перегляду всього тексту. До простого гіпертексту відноситься і система, яка дає можливість переглядати відсилання до літератури, що містяться в тексті, не звертаючись безпосередньо до списку літератури. Складні гіпертексти володіють багатою системою переходів між компонентами гіпертексту, в них відсутнє уявлення про базове тексті, з яким пов'язані другорядні за значимістю тексти. У певному сенсі нормальний, звичайний гіпертекст і є складним гіпертекстом.

За способом існування гіпертексту виділяються статичні і динамічні гіпертексти. Статичний гіпертекст не змінюється в процесі експлуатації; в ньому користувач може фіксувати свої коментарі, однак вони не змінюють суть справи. Для динамічного гіпертексту зміна є нормальною формою існування. Зазвичай динамічні гіпертексти функціонують там, де необхідно постійно аналізувати потік інформації, тобто в інформаційних службах різного роду. Гіпертекстової є, наприклад, Аризонська інформаційна система (AAIS), яка щомісяця поповнюється на 300-500 рефератів на місяць.

Відносини між елементами гіпертексту можуть спочатку фіксуватися творцями, а можуть породжуватися щоразу, коли відбувається звернення користувача до гіпертексту. У першому випадку мова йде про гіпертексту жорсткої структури, а в другому - про гіпертексту м'якої структури. Жорстка структура технологічно цілком зрозуміла. Технологія організації м'якої структури повинна грунтуватися на семантичному аналізі близькості документів (або інших джерел інформації) один до одного. Це нетривіальне завдання комп'ютерної лінгвістики. В даний час широко поширене використання технологій м'якої структури на ключових словах. Перехід від одного вузла до іншого в мережі гіпертексту здійснюється в результаті пошуку ключових слів. Оскільки набір ключових слів кожен раз може різнитися, щоразу змінюється і структура гіпертексту. Жорсткість чи м'якість архітектури гіпертексту залежить і від кількості інформації, яка в ньому міститься. Якщо вузлів у мережі гіпертексту порядку однієї-трьох тисяч, то найчастіше використовується жорстка архітектура, якщо ж кількість вузлів досягає декількох десятків тисяч або навіть мільйонів одиниць, то м'яка структура виявляється більш кращою, оскільки кодування жорстких зв'язків забирає надто багато часу. Зауважимо, що структура Інтернету часто функціонує як гіпертекст м'якої архітектури.

Технологія побудови гіпертекстових систем не робить різниці між текстової та нетекстової інформацією. Тим часом включення візуальної та звукової інформації (відеороликів, картин, фотографій, звукозаписів тощо) вимагає істотної зміни інтерфейсу з користувачем і більш потужної програмної та комп'ютерної підтримки. Такі системи отримали назву гіпермедіа або мультимедіа. Наочність мультимедійних систем визначила їх широке використання у навчанні, у створенні комп'ютерних варіантів енциклопедій. Відомі, наприклад, чудово виконані CD-роми з мультимедійними системами по дитячих енциклопедій видавництва "Дорлінг Кіндерслі".

Деякі гіпертекстові системи. Технологічно в основі гіпертексту лежать комп'ютерні програми, які підтримують такі базові функції:

забезпечення швидкого перегляду інформаційного масиву (браузинг);

обробка посилальних відносин (звернення і виклик фрагмента тексту або іншої інформації, на яку проводиться відсилання);

навігація по гіпертексту, запам'ятовування маршруту руху; подання шляху руху в легко сприймається формі;

можливість формування звичайного лінійного тексту як результату руху по гіпертексту;

додаток гіпертексту новою інформацією;

введення нових відносин у структуру гіпертексту (для систем з жорсткою структурою).

Програмні оболонки гіпертексту, як правило, універсальні. Вони можуть використовуватися в різних областях для створення тематично різних гіпертекстів. Такі, наприклад, оболонка ZOG і розроблена на її основі промислова гіпертекстова система KMS (університет Карнегі-Меллон, США). Сфери застосування цих гіпертекстових систем надзвичайно різноманітні - від роботи з документацією та підтримки електронної пошти до гіпертекстів, призначених для експертів, що працюють над бюджетом. Є й спеціалізовані системи. Так, система NoteCards (продукт компанії "Xerox PARC") призначена для аналітичної роботи, а система WE, моделююча особливості отримання нового знання - для допомоги в авторській роботі. Найбільш популярні в даний час програмні пакети HyperCard компанії "Apple". Вони відносно прості у використанні. Гіпертекст в оболонці HyperCard представляється у вигляді каталожних карток. Користувач за допомогою досить простого інтерфейсу організує структуру картки і встановлює зв'язки між картками. Пакети HyperCard дозволяють поєднувати різні типи інформації, зокрема картки можуть включати графічну, звукову та ін інформацію. Слід зазначити, що сучасні бази даних також включають поля для візуальної та звукової форми даних (пор., наприклад, базу даних ACCESS 7, що працює в середовищі Windows). Близька до HyperCard за своїми властивостями і програма SuperCard фірми "Silicon Beach". Деякі системи гіпертексту містять спеціальні засоби орієнтації користувача в гіперпростору - карти або закладки, що відзначають найбільш відвідувані вузли гіпертексту. Комплексом засобів орієнтації має система Hypergate Writer фірми "Eastgate Systems Inc".

Література

Баранов О.М. Категорії штучного інтелекту в лінгвістичній семантиці. Фрейми і сценарії. М., 1987.
Городецький Б.Ю. Комп'ютерна лінгвістика: моделювання мовного спілкування / / Нове в зарубіжній лінгвістиці. Вип. XXIV. Комп'ютерна лінгвістика. М., 1989. С.5-31.
Войскунскій А.Є. Моделювання мислення / / Мовне спілкування: проблеми і перспективи. М., 1983. С.16-60.
Олкер X. Р. Чарівні казки, трагедії і способи виклад світової історії / / Мова та моделювання соціальної взаємодії. М., 1987. С.408-440.
Поспєлов Д.О. Ситуаційне управління. Теорія і практика. М., 1986. С.71-83; 99-106.
Суботін М.М. Гіпертекст. Нова форма письмової комунікації / / ВІНІТІ. Сер. Інформатика. Т.18. М., 1994.